|
1.
基于症状构成成分的上下位关系自动抽取方法
王婷, 王祺, 黄越圻, 殷亦超, 高炬
计算机应用
2017, 37 (10):
2999-3005.
DOI: 10.11772/j.issn.1001-9081.2017.10.2999
针对症状间上下位关系具有较强结构特性的问题,提出一种基于症状构成成分的上下位关系自动抽取方法。首先,通过观察症状实体,发现症状可以切分为原子症状词、修饰词等八种成分,且成分的构成序列满足一定的规则。然后,利用词法分析系统和条件随机场模型对症状进行切分和成分标注。最后,把症状之间的关系抽取看作一个分类问题,选取症状成分的构成特征、词典特征以及通用特征作为分类算法的特征;基于多种分类算法训练模型,将症状间的关系分为上下位关系和非上下位关系。实验结果表明,当选用支持向量机算法,同时选用三类特征时,取得了最好的效果,准确率、召回率和
F1值分别达到了82.68%、82.13%和82.40%。在此基础上,使用所提出的关系抽取算法,抽取了20619条上下位关系,构建了具有上下位关系的症状知识库。
参考文献 |
相关文章 |
多维度评价
|
|